Folien
- Einführung (Henrich: Kapitel 1.1, 1.2, 1.3)
- Beurteilung von IR-Systemen (Henrich: Kapitel 2)
- Sprachanalyse (Henrich: Kapitel 3.1, 3.2, 3.3.1, 3.3.2, 3.4.1, 3.6)
- Invertierter Index, Boolesches Retrieval (Henrich: Kapitel 4.2.1, 4.3)
- Vektorraummodell (Henrich: Kapitel 5.1, 5.2, 5.4, 5.5)
- Einführung in das Web-Retrieval (ohne Seiten 21, 23, 46, 49, 50, 53, 54)
- Crawling (Seiten 1–5, 8, 9, 15, 16, 25–30, 37, 38)
- Linkanalyse (Seiten 43–48, 61, 69)
- Spam, Hardware, Metasuche, Privatsphäre (Seiten 17–35, 42–52, 55–65)
- Clusteranalyse (Henrich: Kapitel 6.2)
Sämtliche Kapitelangaben schließen die Unterkapitel mit ein. Beispielsweise gehören zum Kapitel 6.2 auch die Unterkapitel 6.2.1 bis 6.2.4.
Übungen
Literatur
- Andreas Henrich: Information Retrieval 1 (Grundlagen, Modelle und Anwendungen)
Andere Vorlesungen
- Wolf-Tilo Balke, Joachim Selke: Information Retrieval and Web Search Engines (SS 2010)
Tools
- iti-ngram (N-gramme von Texten ermitteln)
Weitere Weblinks
- Google container data center tour (YouTube-Video)
- Open Directory Project (Webverzeichnis)
- Newsmap (Kartendarstellung von Nachrichten)
- Eyeplorer (Browsing-Oberfläche für die Wikipedia)